概要 - 3.2. Tuning the hyper-parameters of an estimator
Hyper-parameters are parameters that are not directly learnt within estimators.
「ハイパーパラメタとは推論器の中で直接学習されないパラメタ」
In scikit-learn they are passed as arguments to the constructor of the estimator classes.
「scikit-learnでは、ハイパーパラメタは推論器クラスのコンストラクタの引数として渡される」
It is possible and recommended to search the hyper-parameter space for the best cross validation score.
「最良の交差検証スコアを求めてハイパーパラメタ空間を検索することができ、推奨される」
searchの構成要素
推論器
パラメタ空間
a method for searching or sampling candidates
「候補を検索またはサンプリングする方法」
交差検証スキーム
スコア関数
Two generic approaches to parameter search are provided in scikit-learn:
for given values, GridSearchCV exhaustively considers all parameter combinations, while RandomizedSearchCV can sample a given number of candidates from a parameter space with a specified distribution.
「所与の値について、GridSearchCVは全てのパラメタの組合せを徹底的に検討する一方、RandomizedSearchCVは特定の分布を使ってパラメタ空間から所与の数の候補をサンプリングできる」
Both these tools have successive halving counterparts HalvingGridSearchCV and HalvingRandomSearchCV, which can be much faster at finding a good parameter combination.
「これらのツールは両方、successive halvingバージョンであるHalvingGridSearchCVとHalvingRandomSearchCVがある」
halve 半減する(lは発音しない)
「halvingバージョンはよいパラメタの組合せを見つけるのがずっと速い」
Note that it is common that a small subset of those parameters can have a large impact on the predictive or computation performance of the model while others can be left to their default values.
「これらのパラメタの小さな部分集合は、ほかをデフォルト値のままにしておくのに対して、モデルの予測性能と計算性能に大きな影響をもちうることがよくあるという点に注意されたい」
It is recommended to read the docstring of the estimator class to get a finer understanding of their expected behavior, possibly by reading the enclosed reference to the literature.
「期待される振る舞いについてよりきめ細やかに理解するために分類器クラスのdocstringを読み、可能であれば(docstringに)同封された文献の参照も読むことをオススメする」